
工具目录

蛋白折叠稳定性评估
抗体功能预测
2025-08-11
立即尝试
Folding Stability
1 简介
通过蛋白序列逆折叠模型ESM-IF,预测蛋白质的绝对稳定性ΔG。
传统的物理方法(如FoldX、Rosetta等)预测蛋白稳定性ΔG,依赖于高置信度结构pdb,如果突变太多,结构置信度降低,预测结果较差。在ProteinGym的benchmark结果表明,生成模型ESM-IF在zero-shot预测DMS数据的蛋白突变稳定性ΔΔG达到同类最佳水平。该方法是在突变预测基础上的延伸,利用ESM-IF模型直接预测完整蛋白折叠稳定性的绝对ΔG值。
经过测试,预测误差RMSE ≈ 1.5 kcal/mol,相关系数为0.7,是预测蛋白质的折叠稳定性ΔG的重大突破。
原理:

图1. 计算原理

图2. 性能表现
- xk : 蛋白某位点为氨基酸k时,使用ESM-IF计算的log-likelihood
- xj : 蛋白遍历20种氨基酸时,在该位点为j时,使用ESM-IF计算的log-likelihood
- Lk:Softmax得到蛋白某位点为氨基酸k时,对稳定性的贡献大小
然后,将蛋白质所有氨基酸位点的Lk加和,得到蛋白整体的log-likelihood。
最后,通过线性整体log-likelihood与实验稳定性ΔG拟合得到拟合参数,根据a/b就可以将log-likelihood转换成蛋白稳定性ΔG了。
2 参数说明
- PDB File:蛋白三维结构的PDB文件
- Target Chain:目标链
3 结果说明
- Protein Stability:数值越大越好
4 参考文献
[1] Predicting absolute protein folding stability using generative models Matteo Cagiada, Sergey Ovchinnikov, Kresten Lindorff-Larsen bioRxiv 2024.03.14.584940. https://doi.org/10.1101/2024.03.14.584940.

